Text copied to clipboard!
Наслов
Text copied to clipboard!Inženjer za pouzdanost sajta
Опис
Text copied to clipboard!
Tražimo Inženjera za pouzdanost sajta koji će se pridružiti našem tehničkom timu i igrati ključnu ulogu u obezbeđivanju visoke dostupnosti, performansi i skalabilnosti naših digitalnih servisa. Kao Inženjer za pouzdanost sajta (SRE), bićete odgovorni za dizajniranje, implementaciju i održavanje sistema koji omogućavaju neprekidan rad naših aplikacija i infrastrukture.
Vaš zadatak će biti da balansirate između razvoja softvera i operacija, koristeći inženjerski pristup za rešavanje problema u produkcionom okruženju. Radom u bliskoj saradnji sa timovima za razvoj, DevOps i bezbednost, doprinosićete unapređenju automatizacije, monitoringa i procesa oporavka od grešaka.
Idealni kandidat ima snažno tehničko znanje, iskustvo u radu sa distribuiranim sistemima, kao i sposobnost da brzo reaguje na incidente i identifikuje korenske uzroke problema. Takođe, očekuje se da doprinosite kulturi pouzdanosti kroz dokumentaciju, edukaciju i unapređenje procesa.
Odgovornosti uključuju razvoj alata za automatizaciju, postavljanje i održavanje sistema za nadzor i upozoravanje, kao i učestvovanje u planiranju kapaciteta i testiranju otpornosti sistema. Bićete uključeni u rotaciju za hitne intervencije (on-call), kao i u retrospektive nakon incidenata kako bi se sprečilo njihovo ponavljanje.
Ako ste strastveni u vezi sa stabilnošću sistema, volite da rešavate kompleksne tehničke izazove i želite da radite u dinamičnom okruženju, pozivamo vas da se prijavite i postanete deo našeg tima.
Одговорности
Text copied to clipboard!- Održavanje visoke dostupnosti i performansi sistema
- Razvoj i implementacija alata za automatizaciju
- Postavljanje i održavanje sistema za monitoring i upozoravanje
- Analiza i rešavanje incidenata u produkcionom okruženju
- Saradnja sa timovima za razvoj i operacije
- Učestvovanje u planiranju kapaciteta i skalabilnosti
- Pisanje i održavanje tehničke dokumentacije
- Učestvovanje u rotaciji za hitne intervencije (on-call)
- Testiranje otpornosti sistema i planiranje oporavka
- Unapređenje procesa kroz retrospektive i analize
Захтеви
Text copied to clipboard!- Diploma iz oblasti informatike, elektrotehnike ili srodne oblasti
- Iskustvo u radu sa Linux/Unix sistemima
- Poznavanje skript jezika (npr. Python, Bash)
- Iskustvo sa alatima za monitoring (npr. Prometheus, Grafana)
- Razumevanje mrežnih protokola i sigurnosnih praksi
- Iskustvo sa cloud platformama (AWS, GCP, Azure)
- Poznavanje CI/CD alata i procesa
- Sposobnost rešavanja problema pod pritiskom
- Odlične komunikacione i timske veštine
- Iskustvo sa kontejnerizacijom (Docker, Kubernetes) je prednost
Могућа питања на интервјуу
Text copied to clipboard!- Koje alate za monitoring ste koristili i kako ste ih konfigurisali?
- Kako pristupate rešavanju incidenata u produkcionom okruženju?
- Imate li iskustva sa automatizacijom operativnih zadataka?
- Kako biste testirali otpornost sistema na greške?
- Koje cloud platforme ste koristili i u kom kontekstu?
- Kako balansirate između brzine isporuke i stabilnosti sistema?
- Da li ste učestvovali u post-mortem analizama incidenata?
- Kako biste unapredili postojeći sistem za upozoravanje?
- Koje metrike smatrate ključnim za praćenje pouzdanosti sistema?
- Kako sarađujete sa timovima za razvoj i DevOps?